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L'invention a pour objet deux sequences nucleiques d'origine plasmidique. 
presentes chez les bacteries du groupe Escherichia coli enterohemorragiques 
(EHEC), I'utilisation desdites sequences pour la recherche des EHEC, 
notamment ceux possedant les genes codant pour les facteurs de virulence, 
5 enterohemolysine et intimine, et plus particulierement la detection specifique du 
serotype 0157 :H7. L'inve ntion vise ega lement un pro cede metta nt en oeuvre 
lesdites sequences ainsi que les trousses de detection les contenant. 



Les bacteries du groupe EHEC appartiennent a la famille des Escherichia 
10 coli producteurs de verotoxines ou VTEC, responsables de syndromes 
diarrheiques dont les consequences peuvent etre fatales chez I'homme. En 
particulier, les EHEC peuvent engendrer des colites hemorragiques (CH), et 
eventuellement I'apparition de complications majeures comme le syndrome 
hemolytique et uremique (SHU) ou le purpura thrombotique thrombopenique 
15 (Griffin et Tauxe, Epidemiol. Rev. 13, 1991, 60-98). 

Aussi, incidence de ces infections sur la sante publique est telle, qu'elle 
implique un contr&le accru des denrees alimentaires et des moyens de 
detections rapides, notamment en cas d'epidemies. 

20 

Plusieurs serotypes, appartenant au groupe EHEC ont ete identifies et 
rendus responsables de differents foyers epidemiques : 0157:H7, 026 :H11. 
0111 :NM, 0103 :H2, 0145 :NM etc (A Cheson et Keush, ASM News 62, 1996, 
302-306). Cependant, c'est le serotype 0157 :H7 qui a ete le plus frequemment 
25 isole. 

Les methodes de detection traditionnelles consistent a identifier les 
bacteries ou a deceler les toxines secretees par celles-ci. La detection de E. coli 
0157 :H7 est principalement realisee sur la base du serotypage, associe a la 
30 recherche de proprietes metaboliques, comprenant I'absence de fermentation du 
sorbitol et/ou I'absence d'activite (3-glucuronidase. II n'existe pas, par ailleurs, de 
methode bacteriologique propre a la detection des EHEC, mais des tests 
permettant d'orienter le diagnostic. En particulier, I'utilisation de geloses 



supplementees avec du sang lave permet de mettre en evidence le caractere 
enterohemolytique, generalement present chez les EHEC. 



De maniere generate, les methodes bacteriologiques et immunologiques 
relatives a la detection de E. coli 0157 :H7 sont longues, fastidieuses, 
rela tivement couteuses et nec essitent une confinnatipn serologique. Par ailleurs, 
ces methodes ne permettent pas d'etablir une identification de E. coli 0157 :H7 
du fait des reactions croisees avec d'autres genres et especes bacteriens, ce qui 
rend I'interpretation difficile. 

L'utilisation de sondes nucl&ques est done apparue comme une 
alternative a ces methodes traditionnelles. Des efforts importants ont ete realises 
pour developper des sondes, capables de detecter d'une maniere sensible et 
specifique les bacteries E. coli de type EHEC, impliquees dans les cas de CH 
et/ou SHU, et dont le prototype le plus repandu est E. coli 0157 :H7. 

En particulier, des sondes ou fragments, permettant la detection des 
genes responsables de la virulence des E. coli, encore appeles facteurs de 
virulence, ont ete publies. Toutefois, aucun des facteurs de virulence 
actuellement connu ne permet a lui seul d'identifier des souches pathogenes de 
E . coli 01 57 :H7 ou des EHEC. 

Ainsi, l'utilisation de sondes ou fragments nucleiques pour la detection 
des genes codant pour les verotoxines (vt1 ou st1, vt2 ou st2), decrite par de 
nombreux groupes de recherche (Karch et Meyer, J. Clin Microbiol. 2Z 1989, 
2751-2757; Gannon eta/. , Appl. Env. Microbiol. 58, 1992, 3809-3815; Begum 
et ai, J. Clin. Microbiol. 31, 1993, 3153-3156; Witham et a/., Appl. Env. 
Microbiol. 62, 1996, 1347-1353), a montre que les genes codant pour les 
verotoxines sont associes aux souches bacteriennes pathogenes E. coli 
0157 :H7 et autres EHEC, mais peuvent aussi etre presents chez des souches 
£ coli non pathogenes, ou eventuellement chez d'autres genres bacteriens 
comme Shigella dysenteriae, Citrobacter freundii, etc. 
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De meme, la proteine d'adhesion denommee intimine est egalement 
impliquee dans la virulence des bacteries de type EHEC. Des sondes ont ete 
notamment selectionnees sur le gene correspondant (eae) par Gannon et al. 
dans J. Clin. Microbiol. 31_, 1993, 1268-1274, Louie et al. dans Epidemiol. Infect 
5 112, 1994, 449-461 et Meng et al. dans Int J. Food Microbiol. 3g 1996, 703- 
113. Cependan t. bien que c^ .tadLeuj^e^jrulence soit etroitemant_associe au 
groupe des EHEC, il est egalement rencontre chez les E. coli enteropathogenes 
(EPEC) comprenant le serotype 055 :H7. 

10 Enfin, des sondes ont ete selectionnees sur un plasmide de 60 MDa, 

codant entre autres pour renterohemolysine, facteur de virulence egalement 
present chez de nombreux EHEC (Levine et al., J. Infect Dis. 156. 1987, 175- 
182; Schmidt et al., Infect Immun. 63, 1995, 1055-1061). Ainsi, le brevet US 
5,475,098 vise les sequences nucleiques contenues dans Toperon de 

15 renterohemolysine, correspondant aux genes hlyA, hlyB et a la region 
intergenique hlyA-hlyB. Les sequences oligonucleotidiques revendiquees 
permettent une detection specifique des EHEC, mais I'invention ne permet pas 
de differencier E. coli 0157 :H7 des autres EHEC. Par ailleurs, le brevet US 
5,652,102, decrit une sequence nucleique situee sur un fragment de restriction 

20 issu du plasmide de 60 MDa. Cependant, I'utilisation d'oligonucleotides derives 
de cette sequence dans une reaction de polymerase en chaine ou "Polymerase 
Chain Reaction" (PCR), ne permet pas a elle seule r identification specifique du 
serotype 0157 :H7, et necessite par consequent I'utilisation conjointe d'amorces 
amplifiant les genes codant pour les verotoxines et Tintimine. 

25 

Dernierement, la demande de brevet WO 97/32045 vise des 
oligonucleotides selectionnes a partir d'une sequence chromosomique obtenue 
par la methode RAPD (Random Amplified Polymorphic DNA), conduisant a la 
detection d'environ 99,5 % de E. coli 0157 :H7, mais les sequences nucleiques 
30 revendiquees detectent egalement pres de 3 % de £ . coli non EHEC, ce qui 
n'est pas satisfaisant en terme de specificite, notamment dans le domaine de 
ragro-alimentaire. 



L'inconvenient majeur de tous ces systemes de detection reside done 
dans le fait qu'aucun d'entre eux, ne permet d'etablir clairement et simplement 
(•identification du serotype E. coli 0157 :H7. II est en effet tres souvent 
necessaire d'associer plusieurs systemes d'amplification et/ou de detection pour 
rendre le resultat precis. Les protocoles utilises sont alors difficiles a mettre en 
aauure (amplif, ( ^tions.iiajltipJes T -simultanees) et les_resultats obtenus quant a la 



sensibility et a la specificite sont fortement dependants, non seulement des 
cibles nucleiques utilisees, mais aussi des conditions operatoires. 

Or, comme il a ete precedemment indique, ce serotype peut provoquer de 
graves syndromes pouvant conduire a la mort, ce qui implique des moyens 
rapides et fiables de detection, notamment en cas d'epidemie. 

Les travaux des inventeurs ont consiste a rechercher des sequences 
specifiques a partir d'une banque genomique de E. coli 0157 :H7, permettant la 
reconnaissance des principaux serotypes de E. coli pathogenes pour I'homme, et 
plus particulierement 0157 :H7. La banque a ete criblee contre E. coli 
enteropathogene 055 :H7, ancetre suppose du serotype 0157 :H7, les deux 
genomes etant extremement proches d'apres les analyses de polymorphisme 
realisees parT. Whittam era/, dans Infect. Immun. 61, 1993, 1619-1629. 

Ces travaux ont permis d'isoler deux fragments nucleiques d'interet pour 
la detection des EHEC et plus particulierement pour la detection de E. coli 
0157:H7, comprenant les sequences nucleiques SEQ ID N°1 et SEQ ID N°2, 
situees sur le plasmide enterohemolytique de 60 MDa. Les clones 
correspondants pDF3 et pDF4 contenant ces sequences ont ete deposes aupres 
de la Collection Nationale de Cultures de Microorganismes de I'lnstitut Pasteur, 
respectivement sous les numeros 1-1999 et I-2000, le 26 mars 1998. 

D'une facon surprenante, il a ete mis en evidence une premiere sequence 
(SEQ ID N-1) comprenant I'association stable d'une partie de la sequence 
d'insertion \S91 et de la sequence issue du gene katP de E coli 0157 H7 ou 
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d'une partie de celle-ci, I'enchalnement nucleique en resultant, jamais decrit par 
ail leurs, etant specif iquement retrouve chez E. coli 0 1 57 : H7. 

Le gene katP, codant pour une catalase-peroxydase, est present sur le 
5 plasmide enterohemolytique de E. coli 0157 :H7 et de nombreuses EHEC 
(Brunder_et_al^MJcrobiol. 142. 1996. 3305-33 15). et la sequence d'insertion 
\S91, identifiee sur les plasmides a-hemolytiques de E. coli (Zabala et ai, J. 
Bacteriol. 151. 1982, 472-476), n'a encore jamais ete decrite chez les souches 
enterohemolytiques de type E. coli 0157 :H7. 

10 

La mise en evidence d'une sequence d'insertion tronquee au niveau de la 
jonction \S91-katP (absence de la sequence inversee repetee gauche (IR L ) de 
\'\S91) suggere aussi une integration stable de \'\S91 dans cette partie du 
genome de E. 00110157 :H7. 

15 

L'analyse des produits amplifies d'un grand nombre de souches 0157 :H7 
d'origines diverses demontre la conservation de cet enchainement nucleotidique 
au sein du serotype 01 57 :H7. 

20 En effet, un produit amplifie de 670 paires de bases a ete observe chez 

toutes les souches testees (55 E. coli 0157 :H7 et 1 E . coli 0157 :H-) avec les 
amorces SEQ ID N°3 et SEQ ID N°4, situees respectivement dans les 
sequences \S91 etkatP. 

25 Par ail leurs, les donnees obtenues a partir des profils de restriction Alu\ et 

Rsa\ effectues sur les produits amplifies de 5 souches 0157 :H7 d'origines 
differentes, ainsi que l'analyse de sequence realisee chez 3 souches, dont 2 
isolees d'epidemies (USA, 1993 et Japon, 1996) ont montre une parfaite 
conservation c'est a dire 100 % d'homologie dans la partie de sequence 

30 analysee (SEQ ID N° 1 : positions (nt) 272 a 624). 

De pltjs, I'enchainement nucleotidique, stable et conserve, est 
probablement un evenement de recombinaison relativement ancien, survenu 
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chez E. coli 0157 :H7 au cours de revolution, puisque des souches isolees en 
des lieux et des epoques differents presentent cette meme caracteristique. 

Cette sequence represente done une cible de choix pour la detection 
5 specifique du serotype 01 57 :H7. 



Une seconde sequence a ete caracterisee (SEQ ID N°2) sur le meme 
plasmide, associee a la presence des facteurs de virulence enterohemolysine 
(ehly) et intimine (eae), caracteres propres aux souches de E. coli 

10 enterohemorragiques, comprenant le serotype 0157 :H7. A ce titre, ce fragment 
presente un interet epidemiologique, car, a la difference des procedes deja 
connus, necessitant la mise en oeuvre de plusieurs systemes moleculaires 
(Paton et Paton, J. Clin. Microbiol. 36, 1998, 598-602), I'utilisation de cette 
sequence pour une application diagnostique donne lieu a une mise en oeuvre 

15 simplifiee et a une interpretation plus rapide des resultats. 

La presente invention a done pour objet les sequences nucleiques SEQ 
ID N°1 et SEQ ID N°2, leurs sequences complementaires, les sequences 
derivees de celles-cl et les fragments utilisables pour la detection specifique des 
20 EHEC, dans un echantillon alimentaire, clinique ou veterinaire, ou de 
I'environnement. 

La presente invention a plus particulierement pour objet une sequence 
specifique pour la detection du serotype E. coli 0157 :H7, comprenant la 
25 sequence SEQ ID N°1 , un fragment de cette sequence ou une sequence derivee 
de celle-ci. 

Selon T invention, la sequence SEQ ID N°1 comprend un enchamement 
nucleotidique resultant d'un evenement de recombinaison stable entre la 
JO sequence du gene katP ou une partie de celle-ci et une sequence d'insertion 
\S91 tronquee. 



Selon la presente invention, on entend par sequence nucleique aussi bien 
la sequence d'ADN ou d'ADN complementaire (ADNc), ou encore la sequence 
d'ARN correspondante. 

L'invention concerne aussi des sequences nucleiques derivees de la SEQ 
-ID N°1 ou la- SEQ ID N°2 , c'est a dire des-sequenees different par mutation, 
insertion, deletion et/ou substitution d'une ou plusieurs bases mais s'hybridant 
neanmoins, dans des conditions de forte stringence, avec Tune des susdites 
sequences. 

Selon l'invention, on entend par forte stringence des conditions de 
temperature et de force ionique telfes qu'elles permettent une hybridation 
specifique entre deux fragments d'acides nucleiques complementaires et limitent 
les fixations aspecifiques (Sambrook et al. , Molecular Cloning, Second Edition 
(1989), 9.47-9.62). Les conditions de temperature sont generalement comprises 
entre (T m moins 5°C) et (T m moins 10°C) lorsque Tune des sequences de I'hybride 
est courte (une vingtaine de nucleotides), T m etant la temperature theorique de 
fusion, definie comme etant la temperature a laquelle 50 % des brins apparies se 
separent. 



On entend egalement selon l'invention, par sequence nucleique derivee 
de la SEQ ID N° 1, toute sequence differant de celle-ci par mutation, insertion, 
deletion et/ou substitution d'une ou plusieurs bases et comportant un 
enchainement de recombinaison stable entre le gene katP et la sequence 
d'insertion \S91 tronquee. 



Plus particulierement, les sequences nucleiques contiennent au moins 8 
nucleotides, preferentiellement 10 nucleotides, ou tres preferentiellement 14 
nucleotides consecutifs de Tenchatnement de la Figure 1, et comprennent les 
nucleotides de la position 400 a la position 407. 

La presente invention a egalement pour objet une seconde sequence, 
specifique des EHEC, qui est la SEQ ID N°2, les sequences complementaires de 
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celles-ci, les fragments de celles-ci et les sequences derivees de celles-ci, ces 
sequences etant toujours detectees chez les EHEC possedant les genes codant 
pour I'enterohemolysine (ehly) et I'intimine (eae) ; ladite sequence SEQ ID N° 2 
etant representee a la Figure 2. 

5 

L'inven tion se rapporte egalement a des fragments oligonucleotidiques, 

issus des sequences SEQ ID N°1 et SEQ ID N°2, utilisables comme amorces 
dans un processus d'amplification ou comme sonde dans le cadre de la mise en 
ceuvre d'un procede de detection, comprenant au moins 8, avantageusement au 
10 moins 10, plus avantageusement 14 nucleotides, et de preference jusqu'a 30 
nucleotides consecutifs de I'enchamement nucleotidique de SEQ ID N°1 ou de 
SEQ ID N°2, lesdites amorces etant susceptibles de s'hybrider aux dites 
sequences dans des conditions de forte stringence, telles que definies ci- 
dessus. 

15 

Les amorces ou sondes de l'invention comprennent egalement des 
oligonucleotides pouvant etre modifies par substitution et/ou addition et/ou 
suppression de plusieurs nucleotides, ou par I'addition a I'une des extremites 
(generalement en 5' pour les amorces ; 3' ou 5' pour les sondes) d'une sequence 
20 nucleique etrangere a la sequence recherchee, ou encore d'une molecule de 
marquage, lesdits oligonucleotides etant neanmoins capables de s'hybrider dans 
des conditions de forte stringence avec des sequences nucleiques 
complementaires presentes chez E. coli 0157 :H7 ou chez les EHEC. 

25 Selon un mode prefere de l'invention, les oligonucleotides peuvent etre 

utilises comme amorces, dans un processus d'amplification genique, conduisant 
a i'obtention d'une quantite importante de copies d'un fragment de SEQ ID N° 1 
ou d'un fragment de SEQ ID N° 2 et permettant respectivement, la detection 
specifique de E. coli 0157 :H7 ou des EHEC. 

30 

L'etape d'amplification peut §tre realis§e par toute methode utilisant les 
techniques classiques d'amplification enzymatique de I'ADN ou de TARN, telles 
que notamment, la technique TAS (Transcription-based Amplication System) 
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30 



proposee par Kwoh et al. dans PNAS, 86, 1989, 1173-1177, la technique 3SR 
(Self-Sustained Sequences Replication) decrite par Fahy et al. dans PCR Meth. 
Appl. I , 1991, 25-33, la technique NASBA (Nucleic Acid Sequence-Based 
Amplification) decrite dans le brevet EP 329 822, ou encore la technique SDA 
(Strand Displacement Amplification) decrite par Walker et al. dans P.N.A.S, 89, 
1992, 392-396 , ou avantaaeu sement la tec hnique P CR telle que decrite 



notamment dans les brevets Europeens, EP 200 362 et EP 201 184, delivres au 
nom de Cetus, ou encore les techniques derivees de ces dernieres et toute 
methode visant a amplifier in vitro les sequences nucleiques. 

Dans un mode de realisation prefere de I' invention, les oligonucleotides 
issus des sequences SEQ ID N°1 et SEQ ID N°2 sont utilises en PCR. 

La detection des produits amplifies peut etre realisee par electrophorese 
15 sur gel de tout ou partie du milieu reactionnel dans lequel ('amplification a ete 
effectuee, notamment sur gel d'agarose ou de polyacrylamide. ou par 
electrophorese capillaire ou par chromatographie. La visualisation d'une bande 
de fragments nucleiques localisee en un point specifique du gel permet d'en 
apprecier la taille, I'intensite de cette bande pouvant etre correlee 
20 grossierement au nombre de copies initiates de la cible a detecter dans 
I'echantillon. 

Selon un autre mode de realisation de I'invention, les oligonucleotides, 
tels que definis ci-dessus, peuvent etre utilises comme sondes dans un 
25 processus d'hybridation pour la detection directe d'une sequence nucleique cible 
ou apres amplification pour la detection des produits amplifies. 

A titre d'illustration, les fragments nucleotidiques peuvent etre marques 
par un element radioactif (par exemple 32 P, ^S , 3 H, ,2S I ) ou par une molecule 
non radioactive notamment biotine, acetylamino-fluorene, fluorochrome. 
digoxigenine, ou par une molecule enzymatique, ou un haptene. Des exemples 
de marquages non radioactifs de sondes sont decrits, par exemple, dans le 
brevet francais de P. Kounlsky n* 78.10975, ou par M.S. Urdea et al., Nucleic 
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Acids Symp. Ser., 24, 1991, 197-200, ou encore par R. Sanchez-Pescador, J. 
Clin. Microbiol. 26. 1988, 1934-1938. 

La methode d'hybridation la plus generale consiste a immobiliser I'acide 
nucleique extrait de I'echantillon a analyser sur un support (nitrocellulose, 

nylon, polystyrene, etc. ) et a inc uber dans des conditions definies de 

temperature et de force ionique, I'acide nucleique immobilise avec la sonde. 
Apres hybridation, I'exces de sonde est elimine et les molecules hybrides 
formees sont detectees par la methode appropriee (mesure de la radioactivite, 
de la fluorescence ou de I'activite enzymatique liee a la sonde). 

Les molecules hybrides formees peuvent egalement etre detectees sans 
qu'il soit necessaire de separer les phases « liee » et « non liee ». On dit alors 
que la detection s'effectue en phase homogene. Ces methodes, telles que 
decrites par T. Walker et a/. Clin. Chemistry 42, 1996, 9-13 et L. Morrison 
(Nonisotopic DNA Probe Techniques, Academic Press, 1992, 312-352) 
concernent notamment la polarisation de fluorescence, dans laquelle une sonde 
est marquee a la fluoresceine et ou I'hybridation entraine une modification de la 
fluorescence, ou encore le transfert d'energie. Dans ce dernier cas, la detection 
repose sur des interactions inter ou intramoleculaires entre deux marqueurs. Un 
premier marqueur appele « donneur » est excite par absorption d'une lumiere a 
une longueur d'onde particuliere. L'energie est transferee a un second marqueur 
appele « accepteur », qui est a son tour excite et emet de l'energie. 

Les sondes oligonucleotidiques peuvent egalement etre mises en ceuvre 
au sein d'un dispositif de detection comprenant un arrangement matriciel 
^oligonucleotides dans lequel, des oligonucleotides d'une longueur donnee, 
sont fixes dans un ordre predetermine sur un support et se chevauchent les uns 
par rapport aux autres d'une ou plusieurs bases ; chaque oligonucleotide etant 
complementaire d'une sequence d'ADN ou d'ARN de la sequence cible a 
detecter. La sequence cible, avantageusement marquee est mise en contact 
avec le dispositif matriciel et peut s'hybrider aux sondes fixees sur le support. Un 
traitement enzymatique permet ensuite d'eliminer les hybrides incomplets 



Connaissant la sequence d'une sonde a une position determinee de ia matrice, il 
est ainsi possible de deduire la sequence nucleotidique de la sequence cible 
analysee et de deduire les mutations eventuellement survenues. 

Une alternative a I'utilisation d'une sequence marquee peut consister en 
-^u t i l isa t ion d'un support— permettant-yne detection « bioelectronique » de 
I'hybridation de la sequence cible sur les sondes fixees sur le support d'un 
materiau, tel que Tor, capable d'agir, par exemple, en tant que donneur 
d'electrons aux positions de la matrice auxquelles un hybride est forme. La 
detection de la sequence nucleique cible est alors determinee par un dispositif 
electronique. Un exemple de realisation d'un biocapteur est decrit dans la 
demande de brevet EP-0721 016 au nom d'Affymax Technologies. 

Selon un mode simple et avantageux de mise en ceuvre, les sondes 
nucleiques peuvent etre utilisees comme sondes de capture. Dans ce cas, la 
sonde dite « sonde de capture » est immobilisee sur un support et sert a 
capturer par hybridation specifique I'acide nucleique cible a partir de I'echantillon 
a tester. Si necessaire, le support solide est separe de I'echantillon et le duplex 
forme entre la sonde de capture et la sequence d'acide nucleique cible est 
ensuite detecte grace a une seconde sonde dite « sonde de detection ». 
marquee par un element detectable. Avantageusement, les sondes de capture et 
de detection sont compl6mentaires de deux regions differentes comprises dans 
la sequence cible (amplifiee ou non ) a detecter. 

La fixation de la sonde de capture sur le support solide peut se faire selon 
des precedes bien connus de I'homme du metier, notamment par adsorption 
passive ou par couplage covalent (Cook et al., Nucleic Acids Res. 16, 1988, 
4077-4095; Nagata et al., FEBS Lett. 183, 1985, 379-382; M. Longlaru et al., 
EP 420 260 A2 ; T. Gingeras et al., EP 276 302 ; E. Homes et LM. Kornes, EP 
446 260). 



L'hybridation des sondes de capture et de detection peut se faire 
separement (en deux temps) ou simultanement (en un temps), notamment selon 
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I'une des methodes decrites par Langhale et Malcolm, Gene 36. 1985, 201-210 
ou par Ranki et al, Gene 21, 1993, 77-85, par Dunn et Hassel, Cell, 12, 1977, 
23-36 ou encore par Ranki et Soderlund dans les brevets US 4,486,539 et 
US 4,563,419. 

— La ptfis e nte dem a nded done egalemenLpour objet des oligonucleotides, 
issus de SEQ ID N°1 ou de SEQ ID N°2, selectionnes comme amorces ou 
comme sondes, susceptibles de s'hybrider dans des conditions stringentes avec 
une sequence d'acide nucleique cible contenue dans I'echantillon teste, 
specifiques de E. co//0157 :H7 ou des EHEC. 

On entend par sequence nucleique cible, toute molecule d'ADN ou ADNc 
ou d'ARN capable de s'hybrider dans des conditions de forte stringence avec un 
oligonucleotide selon Pinvention. . 

Les oligonucleotides preferes dont les sequences sont specifiees en 
annexe correspondent aux positions sur les sequences SEQ ID N° 1 et 
SEQ ID N° 2 rapportees dans le tableau ci-apres : 

Position dans 

Sequence SEQ ID N°1 



SEQ ID N°3 : 


9-30 


SEQ ID N°4 . 


679 - 658 


SEQ ID N°5: 


6-30 


SEQ ID N°6 : 


682 - 658 


SEQ ID N°7 : 


241 - 263 


SEQ ID N°8 : 


47 - 69 


SEQ ID N°9 : 


251 - 274 


SEQ ID N°10 


426 - 401 


SEQ ID N°1 1 


427-402 


SEQ ID N°12 


391 - 421 


SEQ ID N°13: 


387-417 


SEQ ID N°14 : 


291 - 321 
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SEQ ID N°15 
SEQ ID N°16 
SEQ ID N°17 
SEQ ID N°18 
SEQ ID N°19 
SEQ ID N°20 



510-540 
331 - 350 

68-87 
397-410 
396 - 41 1 
395-412 



SEQ ID N°2 

SEQ ID N°21 : 
SEQ ID N°22 : 
SEQ ID N°23 : 
SEQ ID N°24 : 
SEQ ID N°25 : 
SEQ ID N°26 : 
SEQ ID N°27 : 

L'invention concerne aussi des couples d'oligonucleotides, tels 
que decrits precedemment, susceptibles d'etre utilises comme amorces pour 
I'amplification d'une sequence nucleique able correspondant a SEQ ID N°1 ou 
SEQ ID N°2, contenue dans le genome de E. coli 0157 :H7 ou des EHEC : 

Les couples d'amorces preferees sont les suivants : 

• pour I'amplification de E. coli 0157 :H7 

- SEQ ID N° 3 et SEQ ID N° 4 

- SEQ ID N° 5 et SEQ ID N° 6 

- SEQ ID N° 6 et SEQ ID N° 7 

- SEQ ID N° 6 et SEQ ID N° 8 

- SEQ ID N° 6 et SEQ ID N° 9 

• pour I'amplification des EHEC : 

- SEQ ID N° 21 et SEQ ID N° 22 
- SEQ ID N° 23 et SEQ ID N° 24 



718-739 
1099-1078 

41 -60 
884 - 863 
928 - 958 
970- 1000 
883 - 903 
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Ainsi, ('utilisation du couple d'amorces SEQ ID N°5 et SEQ ID N°6 pour 
realiser I'amplification de I'acide nucleique de E. coli 0157 :H7 conduit a 
I'amplification d'un fragment nucleique de 676 pb, caracteristique des souches 
de E. coli 0157 :H7. La specificite de ce fragment peut etre eventuellement 
controlee par ('utilisation de la sonde SEQ ID IM° 18. 



De meme, I'utilisation du couple d'amorces SEQ ID N° 21 et 
SEQ ID N° 22 amplifie specifiquement une sequence nucleique de 382 pb, 
presente chez les EHEC, possedant aussi les caracteres enterohemolysine et 
intimine. Les bacteries appartenant aux autres groupes de E. coli, comme les 
ETEC (E. coli producteurs d'enterotoxines), les EPEC etc, ne sont pas 
detectees. La specificite du produit amplifte peut etre par ailleurs confirmee a 
I'aide de sondes oligonucleotidiques internes au fragment amplifie, telles que 
SEQIDNT27. 



La presente invention a egalement pour objet des oligonucleotides, tels 
que precedemment decrits, susceptibles d'etre utilises comme sondes pour la 
detection d'une sequence de nucleotides, eventuellement amplifiee. Par 
exemple, les sequences oligonucleotidiques SEQ ID N° 14, SEQ ID N°15 et SEQ 
ID N° 18 peuvent etre utilisees pour la detection specifique de E. coli 0157 :H7. 
De meme, I'utilisation des sequences SEQ ID N° 25, SEQ ID N° 26 et SEQ ID N° 
27 permet la detection des EHEC dont 0157:H7. 

L'invention a egalement pour objet les plasmides contenant les sequences 
SEQ ID N° 1 et SEQ ID N° 2 mentionnees precedemment ainsi que les cellules 
hotes les contenant. 

L'invention vise aussi un procede pour la detection in vitro de E. coli 
0157 :H7 ou des EHEC dans un echantillon, caracterise en ce qu'il 
comprend les etapes suivantes : 

1 . la mise en contact de I'echantillon avec I'un des couples d'amorces, 
tels que decrits ci-dessus, I'acide nucleique contenu dans I'echantillon ayant ete, 
le cas echeant, rendu accessible a I 'hybridation des amorces a I'acide nucleique 
de la cible recherchee, 
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2. 1'amplification de la sequence nucleique encadree par le couple 
d'amorces choisi, 

3. la verification de la presence eventuelle du produit amplifie pouvant 
s'effectuer selon une methode connue de I'homme du metier, telle que 
precedemment decrite. 



Selon un mode de realisation avantageux, les fragments amplifies 
peuvent etre detectes selon le principe de la methode dite « sandwich ». 

Entre egalement dans le cadre de I'invention, un procede pour la 
detection in vitro de sequences nucleotidiques specifiques de E. coli 0157 :H7 
ou des EHEC, prealablement amplifiees par detection sur un support, par 
exemple une plaque de micro-titration et, caracterise en ce qu'il comprend les 
etapes suivantes : 

- denaturation de la sequence amplifiee de E. coli 0157 :H7 et/ou des 
EHEC par un moyen physique ou chimique. On preferera I'addition d'une 
solution denaturante composee de 200 mM NaOH, 40 mM EDTA, 

- mise en contact, dans un tampon d'hybridation approprie des fragments 
amplifies denatures avec, d'une part au moins une sonde de capture fixee sur le 
support, et d'autre part, au moins une sonde nucleique de detection libre dans le 
tampon d'hybridation, eventuellement marquee, susceptible de s'hybrider avec le 
meme brih des fragments amplifies que celui avec lequel la sonde de capture est 
hybridee, mais en une region distincte de celle hybridee avec la sonde capture ; 
ladite solution d'hybridation pouvant etre avantageusement SSPE (Sodium 
Saline Phosphate EDTA ; Molecular Cloning, A practical guide, Sambrook et a/., 
VgM, 1989, annexe B13) 5 fois concentre, 0,5% Tween 20, Merthiolate 0,01 % , 

- incubation du melange reactionnel pendant une periode suffisamment 
longue pour permettre I'hybridation ; cette incubation pouvant etre, par exemple, 
avantageusement accomplie a 37°C pendant environ 1 heure, 

- un ou plusieurs lavage(s) du melange precedent, afin d'eliminer toute 
sequence nucleique n'ayant pas reagi ; lesdits lavages pouvant etre par exemple 
effectues avec une solution contenant du Tris-HCI 10 mM, NaCI 300 mM et 
Tween 20 0,1%, pH 7,4. 
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- revelation des sondes de detection hybridees aux sequences nucleiques 
amplifies. 

Selon un mode avantageux de I'invention, la sonde de detection est 
marquee a la peroxydase, et la revelation de Tactivite de la peroxydase liee a la 
sonde de detection hybridee est rea lisee par lecture colorimetriq ue, en presence 
d'un substrat chromogSne, selon les etapes suivantes : 

-depdt d'une solution contenant un substrat chromogene, tel que le 
tetram6thylbenzidine (TMB ) ( dans chacun des puits contenant le melange de la 
reaction, et incubation £ l'obscurit6 de la microplaque pendant un temps 
suffisant, generalement 20 a 30 min., puis la reaction est arretee par Taddition 
d'une solution d'arret, ladite solution etant avantageusement une solution de 
H 2 S0 4 utilisee a une concentration finale de 0.5 N, 

- determination de la density optique, ladite determination etant realisee a 
une longueur d'onde de 450 nm (reference 620 nm) lorsque le TMB est utilise 
comme substrat chromogdne. 

Selon un mode de realisation particulierement avantageux, la sonde de 
capture utilisee pour la detection de E. coli 0157 :H7 peut etre SEQ ID N°15 et 
la sonde de detection est I'oligonucleotide SEQ ID N°18. De meme, la sonde de 
capture utilisee pour la detection des bacteries EH EC peut etre SEQ ID N°25 et 
la sonde de detection I'oligonucleotide SEQ ID N°27. 

L'invention concerne egalement une trousse de detection, pour 
ridentification de E. coli 0157 :H7 ou des EHEC, contenus dans un echantillon, 
comprenant parmi les reactifs : 

- au moins deux oligonucleotides tels que definis precedemment, utilises 
comme amorces pour ramplification de E. coli 0157 :H7 ou des bacteries du 
groupe EHEC, 

- eventuellement, un composant pour verifier la sequence du fragment 
amplifie, plus particulierement, une sonde nucleique telle que definie 
precedemment. 
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Les exemples suivants sont donnes a titre non limitatif pour illustrer 
I' invention. 

EXEMPLE 1 

Caracterisation des sequences SEQ ID N°1 et SEQ ID N°2 



1 ) Construction de la banque genomique de E. coli 01 57 :H7 : 
L'ADN genomique de la souche E. coli 0157 :H7 isolee des selles d'un 
patient atteint de colite hemorragique et productrice des verotoxines de type 1 et 
2 a ete digere partiellement par I'endonuclease Pstl (Boehringer Mannheim ; 
Ref. 621625) en faisant agir 0.03 unite d'enzyme par ug d'ADN en milieu 
tamponne pendant 1 heure a 37°C. L'ADN genomique ainsi digere a permis de 
generer des fragments de 35-45 kb. Le cosmide pHC79 (Hohn et Murray, Proc. 
Natl. Acad. Sci 74, 1977, 3259-3263) a ete digere de la meme maniere et 
dephosphorile pour eviter toute autoligation. 

La ligation s'est effectuee en melangeant 900 ng de vecteur et 2.6 ug de 
fragments d'ADN de 35-45 kb (soit un rapport molaire vecteur/insert de 2), le 
milieu reactionnel etant laisse d 14°C pendant 18 heures apres avoir ete 
additionne de 2 unites de T4 DNA ligase (Boehringer Mannheim ; Ref. 481220). 
Les cosmides recombinants ont ete encapsides in vitro et utilises pour 
transformer les bacteries E. coli XL1-Blue MR (Stratagene ; Ref. 200300). Les 
bacteries transformees ont ete incubees 1 heure a 37°C en milieu LB (Luria- 
Bertani, Molecular Cloning, A practical guide, Sambrook et al., Vol.3. 1989, 
annexe A1). Les fragments d'ADN de 35-45 kb etant inseres dans le vecteur 
pHC79 de maniere a abolir le site de resistance ampicilline et preserver le site 
de resistance tetracycline, les bacteries ont ete ensuite etalees sur milieu selectif 
gelose contenant 12.5 ug/ml de tetracycline. 



Des mini-preparations d'ADN cosmidique ont ete effectuees a partir des 
360 premieres colonies isolees sur tetracycline en utilisant le Kit REAL Prep96 
distribue par Quiagen (Ref. 261 71 ). 
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L'ADN de ces preparations a ete ensuite digere par les endonucleases 
Pstl, EcoRI et Sail (Boehringer Mannheim, Ref. 621625, 703737 et 567663), 
analyse en electrophorese sur gel d'agarose a 1.2 % puis transfere sur filtre de 
nylon Hybond N* (Amersham, Ref. RPN 303B). L'ADN a ete fixe de facon 
irreversible par 5 mn d'exposition aux UV. 



2) Criblage de la banque : 

Les hybridations ont ete realisees avec une sonde d'ADN homologue 
provenant de la souche E. coll 0157 :H7 (Collection de I'lnstitut Pasteur, n° 
103571) et avec une sonde d'ADN heterologue constitute d'un « pool » d'ADN 
provenant de 8 souches E. coli 055 :H7 (Collection de I'lnstitut Pasteur, n° 
105215, 105216, 105217, 105228, 105239, 105240, 105241, 105242). 

Les differents filtres ont ete hybrides pendant 16 a 18 heures a 65°C dans 
une solution contenant du tampon SSC (Sodium Saline Citrate; Molecular 
Cloning, A practical guide, Sambrook et al., Vol. 3. 1989, annexe B13) 6 fois 
concentre, de la solution de Denhart 5 fois concentree (Molecular Cloning, Vol.3. 
1989, annexe B15), 10 % de sulfate dextran (Pharmacia Biotech, Ref. 17-0340- 
02), 10 mM EDTA, 0.5 % SDS, 100 ug/ml ADN simple brin de sperme de 
saumon et I'ADN relevant (01 57 :H7). 

Apres hybridation, les filtres ont ete laves 2 fois 10 mn dans un tampon 
SSC 2 fois concentre a 65°C, 1 fois 30 mn dans un tampon contenant du SSC 2 
fois concentre et 0.1 % SDS a 65°C puis 1 fois 10 mn dans du SSC dilue au 
1/1 Oe a 65°C. Les filtres encore humides ont ete exposes en cassette avec un 
ecran intensifiant pendant 24 a 48 heures a -80°C. 

Apres le temps d'exposition necessaire, les films ont ete developpes puis 
les membranes de nylon deshybridees en effectuant 4 a 5 cycles de bains a 
45°C sous agitation. Pour chaque cycle, 2 bains successifs de 30 mn dans une 
solution de NaOH 0.5 N puis 30 mn dans un tampon contenant du SSC dilue au 
1/10e et SDS 0.1 % ont 6te effectues. Les membranes ont finalement ete lavees 
en SSC 2 fois concentre et mises en cassette pour verifier qu'il ne reste plus de 
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traces d'hybridation. Apres deshybridation, les filtres ont ete hybrides de la 
meme maniere que precedemment avec un pool d'ADN non relevant (055 :H7). 

3) Isolement et clonage des fragments SEQ ID N°1 et SEQ ID N°2 : 

Les resultats de ces hybridations ont permis d'identifier deux clones 
cosmidiqu es a partir desq uels un fragment d' environ 1 a 2 kb, hybridant avec la 
sonde homologue et n'hybridant pas avec la sonde heterologue, a ete isole 
respectivement. Apres avoir verifie leur conservation chez differentes souches 
0157 :H7 par hybridation en « dot-blot », ces fragments ont ete clones dans un 
vecteur pUC18 (Oncor Appligene, Ref. 161131) puis prepares en grande 
quantite. Les plasmides recombinants ont ete denommes pDF3 et pDF4 et 
correspondent respectivement aux sequences SEQ ID N°1 et SEQ ID N°2. 

4) Determination des sequences SEQ ID N°1 et SEQ ID N°2 

Les fragments ont 6te sequences selon la methode de Sanger et al. 
decrite dans Proc, Natl. Acad. Sci. 7£ 1977, 5463, en utilisant le « primer 
universel » et le « reverse primer » du plasmide pUC18, ainsi que des 
oligonucleotides internes aux sequences. 

La sequence SEQ ID N°1 (Figure 1), contenant 1489 pb, presente une 
homologie de 99,9 % avec le gene katP de E. coli 0157 :H7 dans la region 407 a 
1489 et une homologie de 95,8 % avec l'IS97 de E. coli dans la region 1 a 406. 

L'analyse de la sequence SEQ ID N°2 (Figure 2), contenant 1 181 pb, ne 
revele aucune sequence connue du plasmide enterohemolytique. Seule la partie 
237 a 570 presente une homologie de 68 % avec le gene plasmidique virK, 
codant pour une proteine de virulence de Shigella flexneri. 
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EXEMPLE 2 

Detection specif iaue de E. coli 01 57 :H7 



L'etude de specificite a ete effectuee sur 100 souches de E. coli de 
serotypes differents et 42 souches non E. coli comprenant, entre autres, des 
b acteries suscep tibles de pr esenter des r eactions croise es av ec E. coli 
0157:H7 comme par exemple Salmonella, Shigella dysenteriae, Citrobacter 
freundii, Hafnia a/vei, Escherichia hermanii. 



1) Extraction del'ADN : 

On obtient les sequences d'ADN par la methode d'ebullition en presence 
de Chelex (InstaGene™ Matrix, Biorad). Les echantillons ont ete prepares selon 
le protocole suivant : 

Une suspension bacterienne est effectuee dans de I'eau ultra pure sterile 
a partir de plusieurs colonies bacteriennes isolees sur gelose Tryptone-Caseine- 
Soja (Sanofi Diagnostics Pasteur, Ref. 53455), puis centrifugee a 10000-12000 
tours / min pendant 2-3 min et le surnageant soigneusement elimine. Le culot 
bacterien est resuspendu dans 200 nl de reactif de lyse, homogeneise puis 
incube dans un bloc chauffant a 100°C pendant 10-15 min. L'echantillon est de 
nouveau homogeneise, puis centrifuge a 10000-12000 tours / min pendant 2-3 
min. L'ADN peut etre amplifie directement ou stocke a -20°C. 

2) Amplification par PCR : 

La reaction ^amplification est realisee dans un volume total de 50 ul 
contenant 50 mM KCI; 10 mM Tris-HCI pH 8,3 ; 0,01% gelatine; 3 mM MgCI 2 ; 
0,25 iM de chaque amorce SEQ ID N°5 et SEQ ID N°6 ; 100 uM (dATP, dCTP, 
dGTP) ; 400 pM dUTP ; 0,5 unite d*Uracyl-DNA-Glycosylase (UDG ; BRL Life 
Technologies) ; 1 unite de Taq DNA Polymerase (BRL Life Technologies) et 5 M l 
d'ADN prepare comme indique dans le paragraphe 1 . 

Apres une incubation a 50°C pendant 2 min puis a 95'C pendant 5 min, 
les echantillons sont soumis a 35 cycles d'amplification composes de 15 sec a 
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95°C, 15 sec a 65 °C et 15 sec a 72°C. Les tubes sont maintenus a 72°C 
jusqu'au retrait du plateau. 

Les cycles thermiques sont realises dans un thermocycleur « Perkin- 
Elmer 9600 ». 

5 Chaque experience comprend un controle positif et un controle negatif. 

3) Visualisation des produits amplifies : 

Les reactions d'amplification sont visualisees sur gel d'agarose ou 
detectees sur microplaque. 

10 3-1 ) Gel d'agarose : 

Apres amplification, 50 \i\ de chloroforme sont ajoutes a chaque 
echantillon afin d'inactiver I'UDG puis une aliquote de chaque reaction est 
analysee par electrophorese sur gel d'agarose & 1,2 % colore au bromure 
d'ethidium, en presence d'un marqueur de taille. La visualisation d'un fragment 

15 d'ADN a 676 pb indique la presence de E. colt 01 57 :H7 dans I'echantillon teste. 

3-2) Hybridation en microplaque : 

Les produits d'amplification sont denatures par addition volume a volume 
d'une solution contenant 200 mM NaOH, 40 mM EDTA. La microplaque dont la 

20 surface des puits est revetue de la sonde de capture SEQ ID N°15 est 
prehybridee dans un tampon d'hybridation contenant du SSPE 5 fois concentre, 
0,5 % Tween 20 et 0,01 % Merthiolate. Puis la microplaque est videe et chacune 
des cupules recoit 200 nl de tampon d'hybridation contenant le fragment amplifie 
denature et la sonde de revelation SEQ ID N°18. L'incubation est effectuee a 

25 37°C sous agitation pendant 1 heure. 

Les cupules sont ensuite lavees six fois avec 400 |il de solution (10 mM 
Tris-HCI pH 7,4 ; 300 mM NaCI et 0,1% Tween 20), puis I'activite de fa 
peroxydase liee a la sonde est detectee en ajoutant dans chaqu cupule 200 \\\ 
d'une solution de detection contenant le chromogene tetramethylbenzidine 

30 (TMB). La microplaque est incubee a 37°C dans I'obscurite pendant 30 min puis 
100 nl d'une solution de 1,5 N H 2 S0 4 sont ajoutes pour bloquer les reactions. 
Les densites optiques sont determinees a 450 nm contre une reference a 620 
nm. 
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4) Etude de la specificite : 

Les tests ont ete effectues sur un total de 142 souches bacteriennes, 
utilisant le couple d'amorces SEQ ID N°5 et SEQ ID N°6 pour I'etape 
5 d'amplification par PCR, la sonde de capture SEQ ID N°15 et la sonde de 
detection SEQ ID N°18 pour I'etap e d'hybridation sur microplaque. _ 

Les resultats obtenus sur microplaque avec les souches E. coli et non 
E. coli (bacteries de genres et especes differents) sont presentes respectivement 
10 dans les Tableaux I et II ci-dessous : 
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Tableau I 



Souche E. coli 


Nombre de 


PCR SEQ ID N° 


(serotype) 


souches 


5/6 




testges 




VTEC/EHEC 






0157:H7 


55 


+ 


0157:H- 


1 


+ 




10 




0111:H- 


2 


- 


0145:1-1- 


2 


- 


O103:H2 


2 


- 


0121:H19 


1 


- 


0165:H25 


1 


- 


045: H2 


1 


- 


022: H8 


2 


- 


0137:H41 


1 


- 


091:H21 


1 


- 


0141H4 


1 




EPEC 






055:H7 


8 


- 


055: H6 


1 


- 


055: H- 


1 




0111:H- 


1 


- 


0111:H2 


1 


- 


0111:H12 


1 




0128:H2 


1 


- 


/-\ m 0*7. 1 1/"* 

0127:H6 


1 




ETEC 






0157:H19 


1 




0159:H34 


1 




CIP.81.86 


1 




E. coli 






CIP 76.24 


1 




CIP 54.8 


1 





Les resultats (+) correspondent a D0 4S o > 2,5. 
Les resultats (-) correspondent a DO450 < 0,05. 
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Tableau II 



Souche 


Nombre de 


PCR SEQ ID 


( spece bacterienn ) 


souches 


N° 5/6 




testees 




waif HUIieila 






Salmonella (groupes 1 a VI) 


10 




Shigella 






Shigella flexneri 


2 




Shigella dysenteriae 


1 


_ 


Shigella sonnei 


1 




Autres 






Escherichia hermanii 


2 




Citrobacter freundii 


2 




Yersinia enterocolitica 


2 




Yersinia pseudotuberculosis 


1 




Hafnia alvei 






Proteus mirabilis 






Proteus vulgaris 






Serratia marcescens 






Klebsiella pneumoniae 






Klebsiella oxytoca 






Enterobacter cloacae 


1 




Enterobacter aerogenes 






Enterobacter agglomerans 






Bacillus subtilis 






Morganella morganii 




- 


Providencia alcalifaciens 


j 




Vibrio parahaemolyticus 






Acinetobacter baumanii 






Shewanella putrefaciens 






Pseudomonas aeruginosa 






Pseudomonas fluorescens 






Listeria monocytogenes 


3 





Les resultats (+) correspondent a DO450 > 2,5. 
Les resultats (-) correspondent a DO450 < 0,05. 



En conclusion, seules les souches 0157 :H7 et 0157 :H- sont detectees 
microplaque avec le systeme susmentionne. 
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EXEMPLE 3 

Detection sp^cifiaue des EHEC 

La specificity a ete testee sur un total de 1 42 souches bacteriennes 
incluant differents serotypes de E. coli ainsi que d'autres especes bacteriennes 
5 pouvant interf6rer avec la detection des EHEC. 

Les ADN ont 6t6 extraits se lon le protoc ole decrit dans le premier paragraphe de 
I'exemple 2. 

Les conditions d'amplification sont les suivantes : 
10 La reaction est realisee dans un volume total de 50 |jl contenant 50 mM KCI; 10 
mM Tris-HCI pH 8,3 ; 1,5 mM MgCI 2 ; 0,5 de chaque amorce SEQ ID N°21 et 
SEQ ID N°22 ; 200 (dATP, dCTP, dGTP, dTTP) ; 1 unite de Taq DNA 
Polymerase (BRL Life Technologies) et 5 jal d'ADN prepare comme indique dans 
le paragraphe 1 de I'exemple 2. 

15 

Les cycles thermiques sont realises dans un thermocycleur « Perkin- 
Elmer 9600 ». 

Chaque experience comprend un controle positif et un controle negatif. 

20 

Les produits d'amplification ont ete visualises sur gel d'agarose colore au 
BET, la presence d'une bande a 382 pb temoignant de la presence d'EHEC 
dans Techantillon teste. 

Les res u I tats sont presentes dans le Tableau ill. 
25 Seules les souches presentant les caracteres ehly et eae, facteurs de 

virulence frequemment associes chez les souches isolees d' infections humaines, 
sont detectees par PCR avec le couple d'amorces SEQ ID N°21 et SEQ ID N°22. 

De plus, I'utilisation dudit couple d'amorces permet egalement de detecter 
30 en particulier, grace a une reaction d'amplification unique, les souches de E. coli 
possedant le genotype (vf*, eae* et ehly*), caracteristique des E. coli 
enterohemorragiques. 
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Tableau 



Souche 
(serotype) 



VTEC/EHEC 

0157:H7 



OTSFft— 

026:H11 

026:H- 
0111:H- 
0145:H- 
O103.H2 
0121:H19 
0165:H25 
045: H2 

022: H8 
0137:H41 
091:H21 

026:H11 
0111:H- 
0141 :H4 

EPEC 

055:H7 
055:H6 
055: H- 
0111:H- 
0111:H2 
0111:H12 
0128:H2 
0127:H6 

ETEC 

0157.H19 
0159:H34 
CIP 81.86 

E. coli 

CIP 76.24 
CIP 54.8 

Non E. coli 



Nombre de 
souches 
testees 



54 



42 



Genotype 



vt+ , ehly+ , 
vt- , ehly+ , 
vt+ , eniy+ , 
vt+ , ehly+ , 
vt- , ehly+ , 
vt+ , ehly+ , 
vt+ , ehly+ , 
vt+ , ehly+ , 
vt+ , ehly+ , 
vt+ , ehly+ , 
vt+ , ehly+ , 
vt+ , ehly+ , 



eae+ 
eae+ 
eae+ 
eae+ 
eae+ 
eae+ 
eae+ 
eae+ 
eae+ 
eae+ 
eae+ 
eae+ 



PCR SEQ 
ID N°21/22 



vt+ , ehly+ , eae 
vt+ , ehly+ , eae- 
vt+ t ehly+ , eae 

vt+ , ehly- , eae+ 
vt+ , ehly- , eae+ 
vt+ , ehly- , eae- 



vt- , ehly- 
vt- , ehly- 
vt- , ehly- 
vt- f ehly- 
vt- , ehly- 
vt- , ehly- 
vt- 1 ehly- 
vt- f ehly- 



, eae+ 
, eae- 
, eae- 
, eae- 
, eae+ 
, eae- 
, eae+ 
, eae+ 



vt- , ehly- , eae- 
vt- , ehly- , eae- 
vt- , ehly- , eae- 



vt- , ehly- , eae- 
vt- , ehly- , eae- 



+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
+ 
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LISTE DE SEQUENCES 

(1) INFORMATION GENERALE 
(i) DEPOSANT : 

(A) NOM : PASTEUR SANOFI DIAGNOSTICS 
(B) RUE : 3 BOULEVA RD RAYMOND POIN CARE 

(C) VILLE : MARNES LA COQUETTE 

(D) PAYS: FRANCE 

(E) CODE POSTAL : 92430 

(iO TITRE DE L'INVENTION : SEQUENCES NUCLEOTIDIQUES POUR LA DETECTION 
DES ESCHERICHIA COLI ENTEROHEMORRAGIQUES 

(iii) NOMBRE DE SEQUENCES : 27 

(2) INFORMATION POUR LA SEQUENCE ID N°1 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 1489 paires de bases 

(B) TYPE : acide nucleJque 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(Hi) DESCRIPTION DE LA SEQUENCE : SEQ ID N°1 : 



1 


CTGCAGTCCG 


GAGATGAAAG 


CACCACTGTG 


TGTACCCCAT 


CAGCGTGGTC 


51 


CCGCAGGCCA 


TGATTTTTGT 


CACAGACTCA 


ATGACTACCG 


GACGCACTGA 


101 


ACCTTCCGGT 


TGTTTCTCCA 


GCCAGTTAAG 


CCAGCGGTTT 


CCCTGCTGAA 


151 


AAATGTCGGC 


AAAACGGGGA 


AGCATCAGAA 


GGGCGGGGGA 


ACTCCGTCCG 


201 


GCCAGTGAAC 


CGTGCCACAC 


TCCGGGCAGT 


ACATGCCGCC 


GGCGCTGATA 


251 


CCGGCAAGAA 


TGGT CGC AAA 


CTCCCGCTCC 


GTGCAGCGGG 


CTATTTCAGG 


301 


ATACCCTTCG 


TCATCAACAC 


GTACAAACCA 


GAAGACCAGC 


TTTTTGTTTC 


351 


TGACATCCAC 


AAAGAAGGGA 


AT ATT C AGGT 


CTGCGCAGCA 


CTCAACGGCA 


401 


TCGTCAGTTG 


CGGCTTGGAA 


CCCCTTAGTA 


TTTTTTGTCT 


GTAGTATCTA 


451 


TCCCAGCAAT 


AGGT AT AT C C 


TGTTGCATCA 


ATAAAGTTGA 


CTTTTGTATA 
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501 


CAACATGCGA 


ATTTCCCTTA 


ATCCGGAGCT 


ATTCGTATGA 


TAAAAAAAAC 


551 


TCTTCCTGTT 


CTGATTCTTC 


TGGCGCTATC 


GGGGAGCTTT 


TCTACCGCTG 


601 


TAGCCGCTGA 


T A AAAAAG AG 


ACTCAAAATT 


TCTACTATCC 


AGAAACACTG 


651 


GATTTAACTC 


CTCTGAGATT 


ACACAGCCCT 


GAATCAAATC 


CCTGGGGGGC 


701 


TGATTTTGAT 


TATGCCACCA 


GATTTCAACA 


GCTGGATATG 


GAGGCTCTGA 


751 


AAAAAGATAT 


CAAAGATTTG 


CTGACAACTT 


CCCAGGATTG 


GTGCCCTGCG 


801 


GATTATGGTC 


ATTATGGTCC 


TTTCTTTATT 


CGTATGGCTT 


GGCACGGTGC 


851 


CGGAA CAT AC 


AGGACATATG 


ATGGCCGGGG 


AGGCGCCAGT 


GGTGGTCAGC 


901 


AACGTTTTGA 


ACCGCTGAAC 


AGCTGGCCGG 


ATAACGTTAA 


TCTGGATAAA 


951 


GCCCGTCGAT 


TGCTGTGGCC 


AGTCAAGAAA 


AAATACGGCT 


CCAGTATTTC 


1001 


CTGGGGAGAC 


CTGATGGTCC 


TGACTGGTAA 


TGTTGCCCTT 


GAATCCATGG 


1051 


GATTTAAAAC 


GCTGGGATTT 


GCTGGCGGAA 


GAGAAGATGA 


CTGGGAGTCG 


1101 


GACCTGGTAT 


ACTGGGGGCC 


TGACAACAAG 


CCTCTTGCAG 


ATAACCGGGA 


1151 


TAAAAACGGG 


AAACTTCAGA 


AACCTCTTGC 


CGCCACGCAG 


ATGGGACTTA 


1201 


TTTATGTCAA 


TCCTGAAGGC 


CCCGGTGGAA 


AACCAGATCC 


TCTGGCTTCC 


1251 


GCGAAAGATA 


TCAGGGAAGC 


TTTTTCACGT 


ATGGCCATGG 


ATGATGAGGA 


1301 


GACTGTGGCC 


CTGATCGCGG 


• GAGGGCATAC 


ATTTGGTAAA 


GCACATGGTG 


1351 


CAGCGTCTCC 


TGAAAAATGT 


ATTGGCGCAG 


GGCCTGATGG 


TGCACCTGTG 


1401 


GAGGAGCAGG 


GACTGGGATG 


GAAAAATAAA 


TGTGGTACAG 


GAAACGGCAA 


1451 


AT AT AC CATC 


ACCAGTGGCC 


TGGAAGGAGC 


CTGGTCGAC 





(2) INFORMATION POUR LA SEQUENCE ID N°2 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 1 181 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : double 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 
(HQ DESCRIPTION DE LA SEQUENCE : SEQ ID N°2 : 

1 CTGCAGGAGA TGGAAAAAAA GCCAAAATAA AAAATTGCCC ATCCCAGCGC 
51 GCTCCAGCTG AAAGTAGGCC TGTTCTGTCC GGTATTTAAA TGCATTGACC 
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101 


GTCCCCGTAT 


TTAAACAATG 


TGATAAATTA 


CTCCGTTACC 


GGAAAACCGC 


5 


151 


TGAACAAAAT 


TCGGGCTGAA 


AAGAGGATCC 


GCCGTTATCT 


GTTGCATTTC 




201 


CCCTTAGCCT 


GACTAGCCAG 


AGACACAATG 


ATCTGTGCCG 


TTCTGTTAAT 




251 


ATCAAACCGG 


TACTCAATAT 


CTTCTCTGGC 


GCTGGCTGCC 


ATCATCCGGA 


10 


301 


AGCGTTCCGG 


TCGGGATAAA 


AAATCGCGCA 


GTGCGCCGGT 


CCATGCAGAC 




351 


ACATCCCCCA 


CGGGTAACAG 


CGTCCCTGTC 


ACATTCTTCT 


GAATGACATC 


15 


401 


AGGGATCCCG 


CCCGTCTCAC 


TGGCGATAAC 


GGGCACGCCG 


GAGACTGACG 




451 


CTTCAGCCAG 


TACCATACCA 


AACGCTTCAT 


TTTCCGAAGG 


CATGACCACC 




501 


ACACTGGCAA 


TCCGGTAGAC 


CGGTAACGCT 


GGGAAAAGGG 


CACCTGCCAT 


20 


551 


TAACACATCT 


CCGCTCATTC 


CCAGGTGTTC 


TGTCTGCTGA 


CGCAGACGTG 




601 


CTTCGTATTC 


TTCACGCCCG 


GCGCCCACCA 


CGAGCCAGCG 


AAATGATTTC 


25 


651 


CCTTCCATCT 


TCAGCTGATA 


CAATACACGC 


AGCATAAATT 


CATGTCCTTT 




701 


TTCGGGACGT 


AGCATCCCCA 


CCTGAACGAT 


AAGCGGAACA 


TTGTCTGCTG 




751 


ATGCAGCCCA 


GGCGTGGATA 


TGCAGGGGTA 


ACGGT CGC AT 


GGCTTCATTA 


30 


801 


TGCAATGCGG 


GCCAGTCGAA 


ACCCGGTGGA 


AT A AC CGTT A 


CCGGTGTCCT 




851 


GACACCTTCC 


GC CAT C AG AT 


GCGCCATCAT 

• 


GGGTGAGATA 


GGCACAACAA 


35 


901 


TGAAATCACA 


CAGATAATTC 


AGGGAAAACG 


TTCTGGTCTT 


ACGGGTGATG 




951 


TAGGTTTTTT 


GTCTGACAAT 


AGTGAAGCGG 


TGACAGCATA 


TCAGACGGCT 




1001 


CAGTCCTGCT 


ATATTACTGT 


CATGGCCACT 


ATGGCAGATG 


ACCAGATCAG 


40 


1051 


GTTTAAATTC 


CCCGATAATC 


CGTCGAAGTC 


TGAGG AT GGA 


AGGAAGGTGA 




1101 


AGGCTGTTCC 


TGAAAGGAAT 


AAAAGTGACA 


TCATGCCCTC 


TTTTTCTGGC 


45 


1151 


TTCCGGAGCA 


ATTTTACTTT 


TTTCTCTGCA 


G 





(2) INFORMATION POUR LA SEQUENCE ID N°3 : 
(0 CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 22 palres de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 



55 



(ii) TYPE DE MOLECULE : ADN (genomique) 
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(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°3 
CGGAGATGAAAGCACCACTGTG 

(2) INFORMATION POUR LA SEQUENCE ID N°4 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 22 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : antisens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N"4 
GGGCTGTGTAATCTCAGAGGAG 

(2) INFORMATION POUR LA SEQUENCE ID N°5 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 25 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°5 : 
GTCCGGAGATGAAAGCACCACTGTG 

(2) INFORMATION POUR LA SEQUENCE ID N°6 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 25 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : antisens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°6 : 
TCAGGGCTGTGTAATCTCAGAGGAG 
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(2) INFORMATION POUR LA SEQUENCE ID N'7 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 23 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°7 
GGCGCTGATACCGGCAAGAATGG 

(2) INFORMATION POUR LA SEQUENCE ID N°8 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 23 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN: sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N 8 8 
GGTCCCGCAGGCCATGATTTTTG 

(2) INFORMATION POUR LA SEQUENCE ID N°9 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 24 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°9 : 
CCGGCAAGAATGGTCGCAAACTCC 
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(2) INFORMATION POUR LA SEQUENCE ID N°10 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 26 paires de bases 

(B) TYPE : acide nuclSique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lingaire 
(£) BRIN : antisens 



(ii) TYPE DE MOLECULE : ADN (g6nomique) 

(Hi) DESCRIPTION DE LA SEQUENCE : SEQ ID N°10 
AAGGGGTTCCAAGCCGCAACTGACGA 

(2) INFORMATION POUR LA SEQUENCE ID N°11 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 26 paires de bases 

(B) TYPE : acide nucl6ique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : Iin6aire 

(E) BRIN : antisens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N"11 
TAAGGGGTTCCAAGCCGCAACTGACG 

(2) INFORMATION POUR LA SEQUENCE ID N"12 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : acide nucl6ique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN: sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°12 : 
CTCAACGGCATCGTCAGTTGCGGCTTGGAAC 
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(2) INFORMATION POUR LA SEQUENCE ID N°13 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : acide nucl6ique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BR IN : sens 



(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°13 
AGCACTCAACGGCATCGTCAGTTGCGGCTTG 

(2) INFORMATION POUR LA SEQUENCE ID N 8 14 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : acide nucteique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°14 
CTATTTCAGGATACCCTTCGTCATCAACACG 

(2) INFORMATION POUR LA SEQUENCE ID N°1 5 : 
0) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : acide nucl6ique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN; sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°15 : 
AATTTCCCTTAATCCGGAGCTATTCGTATGA 
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10 



(2) INFORMATION POUR LA SEQUENCE ID N°16 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 20 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 
(F) B RIN : sens 



(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°16 
GAAGACCAGC I I I I I GTTTC 



(2) INFORMATION POUR LA SEQUENCE ID N°17: 
15 (i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 20 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 
20 (E) BRIN : sens 



(ii) TYPE DE MOLECULE : ADN (genomique) 



(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N"17 
25 TGTCACAGACTCAATGACTA 

(2) INFORMATION POUR LA SEQUENCE ID N s 18 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 
(A) LONGUEUR : 14 paires de bases 
30 (B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

35 (ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°18 
GGCATCGTCAGTTG 



40 
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(2) INFORMATION POUR LA SEQUENCE ID N°19 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 16 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 



(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N'19 
CGGCATCGTCAGTTGC 

(2) INFORMATION POUR LA SEQUENCE ID N°20 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR: 18 paires debases 

(B) TYPE : acide nuclSique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (gSnomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°20 
ACGGCATCGTCAGTTGCG 

(2) INFORMATION POUR LA SEQUENCE ID N°21 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 22 paires de bases 

(B) TYPE : acide nucteique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°21 : 
CCACCTGAACGATAAGCGGAAC 
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(2) INFORMATION POUR LA SEQUENCE ID N°22 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 22 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : antisens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°22 
CACCTTCCTTCCATCCTCAGAC 



INFORMATION POUR LA SEQUENCE ID N e 23 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE : acide nucleique 
(O NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N c 23 : 
25 ATCCCAGCGCGCTCCAGCTG 

(2) INFORMATION POUR LA SEQUENCE ID N°24 : 
0) CARACTERISTIQUE DE LA SEQUENCE : 
(A) LONGUEUR : 22 paires de bases 
30 (B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : antisens 

35 (u) TYPE DE MOLECULE : ADN (genomique) 



(2) 



15 



20 



(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N"24 : 
ACCCATGATGGCGCATCTGATG 



40 
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(2) INFORMATION POUR LA SEQUENCE ID N°25 : 
(i) CARACTERI STIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : aclde nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN : sens 



(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N"25 
ACGTTCTGGTCTTACGGGTGATGTAGGTTTT 

(2) INFORMATION POUR LA SEQUENCE ID N"26 : 

(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 31 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN: sens 

(ii) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°26 
TAGTGAAGCGGTGACAGCATATCAGACGGCT 

(2) INFORMATION POUR LA SEQUENCE ID N°27 : 
(i) CARACTERISTIQUE DE LA SEQUENCE : 

(A) LONGUEUR : 21 paires de bases 

(B) TYPE : acide nucleique 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(E) BRIN: sens 

(«) TYPE DE MOLECULE : ADN (genomique) 

(iii) DESCRIPTION DE LA SEQUENCE : SEQ ID N°27 : 
GTGAGATAGGCACAACAATGA 
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REVENP1CATIONS 

1. Sequence nucleotidique isolee comprenant la sequence nucleique SEQ 
ID N°1 ou la sequence nucleique SEQ ID N°2, leurs sequences 
complementaire s, les fragment s et sequenc es derivees de celle s-ci f diffe rent par 
mutation, insertion, deletion et/ou substitution d'une ou plusieurs bases et 
s'hybridant dans des conditions de forte stringence avec les sequences SEQ ID 
N°1 et SEQ ID N°2, respectivement. 

2. Sequence nucleotidique isolee comprenant la sequence SEQ ID N°1, les 
sequences complementaires de celles-ci et les sequences derivees de celle-ci, 
comprenant un enchainement nucleotidique resultant de Tassociation stable d'au 
moins une partie de la sequence d'insertion /S91 et au moins une partie de la 
sequence du gene katP. 

3. Sequence nucleotidique isolee selon la revendication 2, comprenant au 
moins 8, avantageusement 10, de preference 14 nucleotides consecutifs de 
I'enchaTnement de la sequence SEQ ID N°1, incluant les nucleotides de la 

20 position 400 a 407. 

4. Sequence nucleotidique isolee comprenant au moins 8 nucleotides 
consecutifs de la sequence SEQ ID N°1 ou de la sequence SEQ ID N°2 f ou de 
sequences complementaires et derivees de celles-ci, telles que definies a la 

25 revendication 1 . 

5. Sequence nucleotidique isolee selon la revendication 4 , choisie parmi 
les sequences nucleiques suivantes : 

SEQ ID N°3 : 5* - CGGAGATGAAAGCACCACTGTG - 3' 
30 SEQ ID N°4 : 5' - GGGCTGTGTAATCTCAGAGGAG - 3' 

SEQ ID N°5: 5' - GTCCGGAGATGAAAGCACCACTGTG - 3' 
SEQ ID N°6 : 5' - TCAGGGCTGTGTAATCTCAGAGGAG - 3' 
SEQ ID N°7 : 5' - GGCGCTGATACCGGCAAGAATGG - 3' 



10 
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SEQ ID N°8 : 5' - GGTCCCGCAGGCCATGATTTTTG - 3' 
SEQ ID N°9 : 5' - CCGGCAAGAATGGTCGCAAACTCC - 3' 
SEQ ID N°10 :5* - AAGGGGTTCCAAGCCGCAACTGACGA - 3' 
SEQ ID N°11 :5" - TAAGGGGTTCCAAGCCGCAACTGACG - 3' 
SEQ ID N°12 :5' - CTCAACGGCATCGTCAGTTGCGGCTTGGAAC - 3' 
-SEQ ID N°13 : 5' -=-AGCACICAACGGCATCGTC AGTTGCGGCTTG - 3" 



SEQ ID N°14 :5' - CTATTTCAGGATACCCTTCGTCATCAACACG - 3' 

SEQ ID N°15 :5' - AATTTCCCTTAATCCGGAGCTATTCGTATGA - 3' 

SEQ ID N°16 .5' - GAAGACCAGC I I I I I GTTTC - 3' 

SEQ ID N°17 .5' - TGTCACAGACTCAATGACTA - 3' 

SEQ ID N°18 :5' - GGCATCGTCAGTTG - 3' 

SEQ ID N°19 .5* - CGGCATCGTCAGTTGC - 3' 

SEQ ID N°20 :5' - ACGGCATCGTCAGTTGCG - 3' 

SEQ ID N°21 :5' - CCACCTGAACGATAAGCGGAAC - 3' 

SEQ ID N°22 :5' - CACCTTCCTTCCATCCTCAGAC - 3' 

SEQIDN°23:5' - ATCCCAGCGCGCTCCAGCTG - 3' 

SEQ ID N°24 :5' - ACCCATGATGGCGCATCTGATG - 3' 

SEQ ID N°25 :5' - ACGTTCTGGTCTTACGGGTGATGTAGGTTTT - 3 1 

SEQ ID N°26 :5' - TAGTGAAGCGGTGACAGCATATCAGACGGCT - 3' 

SEQ ID N°27 :5' - GTGAGATAGGCACAACAATGA - 3' 

6. Couples de sequences nucleotidiques isolees selon les revendications 4 
ou 5, utilises comme amorces, choisis parmi des couples suivants de sequences 
suivantes : 

- SEQ ID N° 3 et SEQ ID N° 4 

- SEQ ID N° 5 et SEQ ID N° 6 

- SEQ ID IM° 6 et SEQ ID N° 7 

- SEQ ID N° 6 et SEQ ID N° 8 

- SEQ ID N° 6 et SEQ ID N° 9 

- SEQ ID N° 21 et SEQ ID N° 22 

- SEQ ID N° 23 et SEQ ID N° 24 



7. Sequence nucleotidique isolee selon la revendication 4 ou 5, utilisee 
comme sonde, choisie parmi les sequences suivantes : 

SEQ ID N°14 , SEQ ID N°25, SEQ ID N°15 , SEQ ID N°26, SEQ ID N°18 , et 
SEQ ID N°27 



8. — Sequence-nucleotidique isoiee-selon-la-revendication 7, caFaGter-isee en 
ce qu'elle est marquee. 

9. Sequence nucleotidique isolee selon la revendication 7, caracterisee en 
ce qu'elle est immobilisee sur un support. 

10. Plasmides pDF3 et pDF4 deposes a la Collection Nationale de Cultures 
de Microorganismes respectivement sous les numeros 1-1999 et I-2000, le 26 
mars 1998. 

1 1 . Cellule note comprenant un plasmide selon la revendication 1 0. 

t 

12. Precede de detection de E. coli 0157 :H7 ou des EHEC dans un 
6chantillon, comprenant les etapes suivantes : 

(a) mise en contact de I'echantillon avec un couple d'amorces 
oligonucleotiques choisi parmi les oligonucleotides definis a la revendication 5 ; 
I'acide nucleique contenu dans I'echantillon ayant ete, le cas echeant, rendu 
accessible aux dites amorces a la cible recherchee, 

(b) amplification de la sequence nucleique encadree par le couple 
d'amorces choisi, 

(c) verification de la presence du produit amplifie par utilisation d'au moins 
une sonde specifique du produit amplified 

13. Procede selon la revendication 12, selon lequel I'etape (c) comprend les 
sous-etapes suivantes : 

(c,) denaturation des sequences amplifies par un moyen physique ou 
chimique, 
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(c 2 ) mise en contact avec une solution contenant les fragments amplifies 
denatures de I'etape (d) avec, d'une part, au moins une sonde de capture, et 
d'autre part, au moins une sonde de detection, eventuellement marquee, les 
sondes de capture et de detection ayant une sequence telle que definie a la 
revendication 1, et susceptibles de s'hybrider avec le meme brin des fragments 
amplifies, ladite mis e en contact eta nt realisee pen dant un temp s suffisant pour 
permettre la reaction d'hybridation, 

(c 3 ) au moins un lavage pour eliminer les sequences nucleiques n'ayant 
pas reagi, 

(c 4 ) revelation des sondes de detection hybridees aux sequences 
nucleiques amplifiees. 

14. Procede selon les revendications 12 ou 13, dans lequel la sonde de 
capture est fixee a la surface d'un puits d'une plaque de microtitration. 

15. Procede selon les revendications 12 ou 13, dans lequel la sonde de 
detection est marquee a la peroxydase. 

16. Procede selon Tune quelconque des revendications 13 a 15, caracterise 
en ce que la mise en evidence de I'activite de la peroxydase liee a la sonde de 
detection ayant reagi, s'effectue par reaction colorimetrique, en presence d'un 
substrat chromogene, tel que le tetramethylbenzidine (TMB), par la mise en 
ceuvre des etapes suivantes : 

- addition du substrat chromogene, tel qu'une solution de TMB dans les 
puits contenant le melange reactionnel, 

- incubation, a I'obscurite, pendant un temps suffisant pour permettre le 
developpement de la coloration, 

- blocage de la reaction par addition d'une solution d'arret, 

- determination de la densite optique a une longueur d'onde appropriee. 

17. Procede de detection de E. coli 0157 :H7, selon I'une quelconque des 
revendications 12 a 16, mettant en ceuvre les oligonucleotides suivants : 
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- les sequences SEQ ID N°5 et SEQ ID N° 6, comme amorces pour 
I'amplification, 

- la sequence SEQ ID N° 15, comme sonde de capture, 

- la sequence SEQ ID N° 18, comme sonde de detection. 

5 

18 - Procede de _ detection des EHEC. selon I'une quelconque des 
revendications 12 a 16, mettant en oeuvre les oligonucleotides suivants : 

- les sequences SEQ ID N°21 et SEQ ID NT 22, comme amorces pour 
('amplification, 

10 - la sequence SEQ ID N° 25, comme sonde de capture, 

- la sequence SEQ ID N° 27, comme sonde de detection. 

19. Trousse pour la detection de E . coli 0157 :H7 ou des EHEC, comprenant 
parmi les reactifs : 

15 - au moins deux oligonucleotides selon la revendication 5, utilises comme 

couple d'amorces, 

- eventuellement au moins une sonde oligonucleotidique selon la 
revendication 5, pour la detection du produit amplifie. 



20 



T 




REVENDICATIONS 

1. Sequence nucleotidique isolee comprenant la sequence nucleique SEQ 
5 ID N°1, ses sequences complementaires, les fragments et sequences d6rivees 
de celle-ci, different par mutation, insertion, deletion et/ou substitution d'une ou 
plusieurs bases et s'hybridant dans des conditions de forte stringence avec la 
sequence SEQ ID N°1. 

10 2. Sequence nucleotidique isolee comprenant la sequence SEQ ID N°1, les 
sequences complementaires de celles-ci et les sequences derivees de celle-ci, 
comprenant un enchalnement nucleotidique resultant de ['association stable d'au 
moins une partie de la sequence d'insertion /S91 et au moins une partie de la 
sequence du gene katP. 

15 

3. Sequence nucleotidique isolee selon la revendication 2, comprenant au 
moins 8, avantageusement 10, de preference 14 nucleotides consecutifs de 
I'enchaTnement de la sequence SEQ ID N°1, incluant les nucleotides de la 
position 400 a 407. 

20 

4. Sequence nucleotidique isolee comprenant au moins 8 nucleotides 
consecutifs de la sequence SEQ ID N°1, ou de sequences complementaires et 
derivees de celle-ci, telles que definies a la revendication 1 . 

25 5. Sequence nucleotidique isolee selon la revendication 4 , choisie parmi 

les sequences nucl§iques suivantes : 

SEQ ID N°3 : 5' - CGGAGATGAAAGCACCACTGTG - 3' 

SEQ ID N°4 : 5' - GGGCTGTGTAATCTCAGAGGAG - 3' 

SEQ ID N°5: 5' - GTCCGGAGATG AAAG C AC C ACTGTG - 3' 
30 SEQ ID N°6 : 5' - TCAGGGCTGTGTAATCTCAGAGGAG - 3' 

SEQ ID N°7 : 5' - GGCGCTGATACCGGCAAGAATGG - 3' 

SEQ ID N°8 : 5' - GGTCCCGCAGGCCATG A I I I I IG - 3' 

SEQ ID N°9 : 5' - CCGGCAAGAATGGTCGCAAACTCC - 3* 
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SEQ ID N°10 :5' - AAGGGGTTCCAAGCCGCAACTGACGA - 3' 
SEQ ID N°11 :5' - TAAGGGGTTCCAAGCCGCAACTGACG - 3' 
SEQ ID N°12 :5' - CTCAACGGCATCGTCAGTTGCGGCTTGGAAC - 3' 
SEQ ID N°13 :5' - AGCACTCAACGGCATCGTCAGTTGCGGCTTG - 3' 
5 SEQ ID N°14 :5' - CTATTTCAGGATACCCTTCGTCATCAACACG - 3' 

SEQ ID N°15 :5' - AATTTC CCTTAATCCG GAGCTATTC GTATGA - 3' 

SEQ ID N°16 :5' - GAAGACCAGC I I I I I GTTTC - 3' 
SEQ ID N°17 :5' - TGTCACAGACTCAATGACTA - 3' 
SEQ ID N'18 :5' - GGCATCGTCAGTTG - 3* 

10 SEQ ID N°19 :5' - CGGCATCGTCAGTTGC - 3' 
SEQ ID N°20 :5* - ACGGCATCGTCAGTTGCG - 3* 

6. Couples de sequences nucleotidiques isolees selon les revendications 4 
ou 5, utilises comme amorces, choisis parmi des couples suivants de sequences 

15 suivantes : 

- SEQ ID 1ST 3 et SEQ ID N° 4 

- SEQ ID N° 5 et SEQ ID N° 6 

- SEQ ID N° 6 et SEQ ID N° 7 

- SEQ ID N° 6 et SEQ ID N° 8 
20 - SEQ ID N° 6 et SEQ ID N° 9 

7. Sequence nucleotidique isolee seion la revendication 4 ou 5, utilisee 
comme sonde, choisie parmi les sequences suivantes : 

SEQ ID N°14 , SEQ ID N°15 et SEQ ID N°18. 

25 

8. Sequence nucleotidique isolee selon la revendication 7, caracterisee en 
ce qu'elle est marquee. 

9. Sequence nucleotidique isolee selon la revendication 7, caractensee en 
30 ce qu'elle est immobilisee sur un support. 

10. Plasmide pDF3 depose a la Collection Nationale de Cultures de 
Microorganismes sous le numero 1-1999 le 26 mars 1998. 




1 
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1 1 . Cellule hote comprenant le plasmicle selon la revenclication 10. 

12. Procede de detection de E . coli 0157 :H7 ou des EHEC dans un 
5 echantillon, comprenant les etapes suivantes : 

(a)_ mise en conta ct de l'Scha ntillon avec un coupl e d'amorces 

oligonucleotiques choisi parmi les oligonucleotides definis a la revendication 5 ; 
I'acide nucleique contenu dans Techantillon ayant ete, le cas ech6ant, rendu 
accessible aux dites amorces a la cible recherchee, 
10 (b) amplification de la sequence nucl6ique encadr§e par le couple 

d'amorces choisi, 

(c) verification de la presence du produit amp I if ie par utilisation d'au moins 
une sonde specifique du produit amplifie. 

15 13. Procede selon la revendication 12, selon lequel I'etape (c) comprend les 
sous-etapes suivantes : 

(d) denaturation des sequences amplifiees par un moyen physique ou 
chimique, 



20 d§natur6s de I'etape (Ci) avec, d'une part, au moins une sonde de capture, et 
d'autre part, au moins une sonde de detection, eventuellement marquee, les 
sondes de capture et de detection ayant une sequence telle que definie a la 
revendication 1, et susceptibles de s'hybrider avec le meme brin des fragments 
amplifies, ladite mise en contact £tant real i see pendant un temps suffisant pour 

25 permettre la reaction d'hybridation, 

(c 3 ) au moins un lavage pour eliminer les sequences nucleiques n'ayant 
pas reagi, 

(C4) revelation des sondes de detection hybridees aux sequences 
nucleiques amplifiees. 



14. Procede selon les revendications 12 ou 13, dans lequel la sonde de 
capture est fixee a la surface d'un puits d'une plaque de microtitration. 



(c 2 ) mise en contact avec une solution contenant les fragments amplifies 
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15. Proced6 selon les revendications 12 ou 13, dans lequel la sonde de 
detection est marquee a la peroxydase. 

16. Precede selon Tune quelconque des revendications 13 a 15, caract6rise 
5 en ce que la mise en Evidence de I'activite de la peroxydase li§e a la sonde de 

detection aya nt r§agi, s'e ffectue par react ion colorimetriqu e, en pr esence d'un 
substrat chromogene, tel que le t6tramethylbenzidine (TMB), par la mise en 
oeuvre des etapes suivantes : 

- addition du substrat chromogdne, tel qu'une solution de TMB dans les 
10 puits contenant le melange r6actionnel, 

- incubation, a Tobscurite, pendant un temps suffisant pour permettre le 
developpement de la coloration, 

- blocage de la reaction par addition d'une solution d'arret, 

- determination de la density optique a une longueur d'onde appropriee. 

15 

17. Proc6d6 de detection de E. coti 0157 :H7, selon Tune quelconque des 
revendications 12 d 16, mettant en csuvre les oligonucleotides suivants : 

-les sequences SEQ ID N°5 et SEQ ID N° 6, comme amorces pour 
Tamplification, 

20 - la sequence SEQ ID N° 15, comme sonde de capture, 

- la sequence SEQ ID N° 18, comme sonde de detection. 

18. Trousse pour la detection de E . coli 0157 :H7 ou des EHEC, comprenant 
parmi les r^actifs : 

25 - au moins deux oligonucleotides selon la revendication 5, utilises comme 

couple d'amorces, 

- eventuellement au moins une sonde oligonucleotidique selon la 
revendication 5, pour la detection du produit amplifie. 



30 



* 



ss/01 



1 

51 

101 

151 

201 

251 

301 

351 
IS91 
401 

451 

501 

551 

601 

651 

701 

751 

801 

851 

901 

951 

1001 

1051 

1101 

1151 

1201 

1251 

1301 

1351 

1401 

1451 



1/2 

CTGCAGTCCG GAGATGAAAG CACCACTGTG 
CCGCAGGCCA TGATTTTTGT CACAGACTCA 
ACCTTCCGGT TGTTTCTCCA GCCAGTTAAG 
AAATGTCGGC AAAACGGGGA AGCATCAGAA 
GCCAGTGAAC CGTGCCACAC TCCGGGCAGT 



CCGGCAAGAA TGGTCGCAAA CTCCCGCTCC 

ATACCCTTCG TCATCAACAC GTACAAACCA 

TGACATCCAC AAAGAAGGGA ATATTCAGGT 

4 ► katP 



TCGTCAGTTG CGGCTTGGAA CCCCTTAGTA 

TCCCAGCAAT AGGTATATCC TGTTGC AT C A 

CAACATGCGA ATTTCCCTTA ATCCGGAGCT 

TCTTCCTGTT CTGATTCTTC TGGCGCTATC 

TAGCCGCTGA TAAAAAAGAG ACTCAAAATT 

GATTTAACTC . CTCTGAGATT ACACAGCCCT 

TGATTTTGAT TATGCCACCA GATTTCAACA 

AAAAAGATAT CAAAGATTTG * CTGACAACTT 

GATTATGGTC ATTATGGTCC TTTCTTTATT 

CGGAACATAC AGGACATATG ATGGCCGGGG 

AACGTTTTGA ACCGCTGAAC AGCTGGCCGG 

GCCCGTCGAT TGCTGTGGCC AGTCAAGAAA 

CTGGGGAGAC CTGATGGTCC TGACTGGTAA 

GATTTAAAAC GCTGGGATTT GCTGGCGGAA 

GACCTGGTAT ACTGGGGGCC TGACAACAAG 

TAAAAACGGG AAACTT C AG A AACCTCTTGC 

TTTATGTCAA TCCTGAAGGC CCCGGTGGAA 

GCGAAAGATA TCAGGGAAGC TTTTTCACGT 

GACTGTGGCC CTGATCGCGG GAGGGCATAC 

CAGCGTCTCC TGAAAAATGT ATTGGCGCAG 

GAGGAGCAGG GACTGGGATG GAAAAATAAA 

ATATACCATC ACCAGTGGCC TGGAAGGAGC 



TGTACCCCAT 
ATGACTACCG 
CCAGCGGTTT 
GGGCGGGGGA 
ACATGCCGCC 
GTGCAGCGGG 
GAAGACCAGC 
CTGCGCAGCA 
TTTTTTGTCT 
ATAAAGTTGA 
ATTCGTATGA 
GGGGAGCTTT 
TCTACTATCC 
GAATCAAATC 
GCTGGATATG 
CCCAGGATTG 
CGTATGGCTT 
AGGCGCCAGT 
ATAACGTTAA 
AAATACGGCT 
TGTTGCCCTT 
GAGAAGATGA 
CCTCTTGCAG 
CGCCACGCAG 
AACCAGATCC 
ATGGCCATGG 
ATTTGGTAAA 
GGCCTGATGG 
TGTGGTACAG 
CTGGTCGAC 



CAGCGTGGTC 
GACGCACTGA 
CCCTGCTGAA 
ACTCCGTCCG 
GGCGCTGATA 
CTATTTCAGG 
TTTTTGTTTC 
CTCAACGGCA 
GTAGTATCTA 
CTTTTGTATA 
TAAAAAAAAC 
TCTACCGCTG 
AGAAACACTG 
CCTGGGGGGC 
GAGGCTCTGA 
GTGCCCTGCG 
GGCACGGTGC 
GGTGGTCAGC 
TCTGGATAAA 
CCAGTATTTC 
GAATCCATGG 
CTGGGAGTCG 
ATAACCGGGA 
ATGGGACTTA 
TCTGGCTTCC 
ATGATGAGGA 
GCACATGGTG 
TGCACCTGTG 
GAAACGGCAA 
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CTGCAGGAGA 
GCTCCAGCTG 
GTCCCCGTAT 
TGAACAAAAT 
CCCTTAGCCT 
ATCAAACCGG 
AGCGTTCCGG 
ACATCCCCCA 
AGGGATCCCG 
CTTCAGCCAG 
ACACTGGCAA 
TAACACATCT 
CTTCGTATTC 
CCTTCCATCT 
TTCGGGACGT 
ATGCAGCCCA 
TGCAATGCGG 
GACACCTTCC 
TGAAATCACA 
TAGGTTTTTT 
CAGTCCTGCT 
GTTTAAATTC 
AGGCTGTTCC 
TTCCGGAGCA 



TGGAAAAAAA 
AAAGTAGGCC 
TTAAACAATG 
TCGGGCTGAA 



GCCAAAATAA 
TGTTCTGTCC 
TGATAAATTA 
AAGAGGATCC 



GACTAGCCAG 
TACTCAATAT 
TCGGGATAAA 
CGGGTAACAG 
CCCGTCTCAC 
TACCATACCA 
TCCGGTAGAC 
CCGCTCATTC 
TTCACGCCCG 
T C AGCTG AT A 
AGCATCCCCA 
GGCGTGGATA 
GCCAGTCGAA 
GCCATCAGAT 
CAGATAATTC 
GTCTGACAAT 
ATATTACTGT 
CCCGATAATC 
TGAAAGGAAT 
ATTTTACTTT 



AGACACAATG 
CTTCTCTGGC 
AAATCGCGCA 
CGTCCCTGTC 
TGGCGATAAC 
AACGCTTCAT 
CGGTAACGCT 
CCAGGTGTTC 
GCGCCCACCA 
CAATACACGC 
V CCTGAACGAT 
TGCAGGGGTA 
ACCCGGTGGA 
GCGCCATCAT 
AGGGAAAACG 
AGTGAAGCGG 
C ATGGC C ACT 
CGTCGAAGTC 
AAAAGTGACA 
TTTCT CTGC A 



AAAATTGCCC 

GGTATTTAAA 

CTCCGTTACC 

GCCGTTATCT 

ATCTGTGCCG" 

GCTGGCTGCC 

GTGCGCCGGT 

ACATTCTTCT 

GGGCACGCCG 

TTTCCGAAGG 

GGGAAAAGGG 

TGTCTGCTGA 

CGAGCCAGCG 

AGCATAAATT 

AAGCGGAACA 

ACGGTCGCAT 

ATAACCGTTA 

GGGTGAGATA 

TTCTGGTCTT 

TGACAGCATA 

ATGGCAGATG 

TGAGGATGGA 

TCATGCCCTC 

G 



ATCCCAGCGC 
TGCATTGACC 
GG AAAACCGC 
GTTGCATTTC 



TTCTGTTAAT 
ATCATCCGGA 
CCATGCAGAC 
GAATGAC AT C 
GAGACTGACG 
CATGACCACC 
CACCTGCCAT 
CGCAGACGTG 
AAATGATTTC 
CATGTCCTTT 
TTGTCTGCTG 
GGCTTCATTA 
CCGGTGTCCT 
GGCACAACAA 
ACGGGTGATG 
TCAGACGGCT 
ACCAGATCAG 
AGGAAGGTGA 
TTTTTCTGGC 
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